查看原文
其他

统计印象 | 要减肥先吃肉?

小数81 海曙统计 2019-05-06


  

在小编学生时代,班里总有那么几个清奇的同学考试不按照常理出牌。

比如:

  大概廿五年前,我们初中的时候,语文随堂测试有一道题:“《朝花夕拾》的作者鲁迅,是(   )人。”

  答案应该是“浙江绍兴人”,测试结果出来,老师怒气冲冲地说:“你们这次答题答的五花八门,什么都有,有人答中国人、男人、地球人什么的也就算了,还有同学答的是死人!”

  我正想哈哈大笑,老师突然指了指我说:“还有你,全班只有你一个人给我答的是‘周树人’!”

  还有一次,考试有一道填空题:李清照是(   )派词人。

  我实在想不起来了,写了“武当派”!

  发试卷的时候,老师气愤的说:有些学生太不像话了,要请家长来学校喝茶。我想完蛋了,肯定要被请家长了。


  结果,请家长的是我可耐的同桌……我偷偷看了一眼她的试卷,O__O "…这货居然写了“蛋黄派”。

  上大学后,我读的专业是应用统计学。自从那以后,我发现学统计的人,脑路也是十分清奇的。

---------+---------


要减肥先吃肉…


  读大学时一位老师喜得一对双胞胎,他十分高兴。有一次他和学生聊天时调侃道,“这下可以做随机对照实验了,以后,要测试什么,那就随机带一个去,另一个可以作为对照。”


科普:随机对照试验

  随机对照试验是一种对医疗卫生服务中的某种疗法或药物的效果进行检测的手段,特别常用于医学,生物学,农学。


  随机对照试验的基本方法是,将研究对象随机分组,对不同组实施不同的干预,以对照效果的不同。


  具有能够最大程度地避免临床试验设计、实施中可能出现的各种偏倚,平衡混杂因素,提高统计学检验的有效性等诸多优点,被公认为是评价干预措施的金标准。

  所以,同卵双胞胎是最佳的对照实验载体。


  前不久,两位英国医生拿自己做人体试验,与英美其他7位医学、营养学、体育界专家一起,完成了一次疯狂而严谨的测试,颠覆了全球对肥胖的认知。

  这两位医生恰好是一对同卵双胞胎,一位是传染病学专家,一位是热带医学专家。他们测试的题目是:糖和脂肪,到底谁更可怕?


  他们其中的哥哥,执行一份糖分超高的膳食计划,只含有极少量的油脂。面包、甜甜圈、意大利面、土豆、米饭、蔬菜水果,甚至可乐和白糖……吃到吐为止。


  弟弟则执行一份脂肪超高的膳食计划,奶酪、肉、牛排、带皮鸡肉、蛋黄……不管吃多少都可以。


  两位医生将这份食谱严格遵守了1个月,得出了如下研究结论:

1、吃碳水化合物(糖)能更好的开展脑力工作,能获得更好的运动爆发力,能更好的锻炼了胰岛素的制造功能,从而血糖反而会下降。

2、吃肉则会消耗更多的能量,因为消化肉需要更多的能量、吃肉并锻炼会减少肌肉,从而更多的减少了体重,但是由于缺乏糖的摄入,抑制了胰岛素的产生,血糖有所上升。

  为了找出隐藏在表象之下的事物发展规律,统计学家对随机对照试验的渴求达到了执着的地步。


  由于现实中同卵双胞胎试验的机会是十分有限的,为了尽可能排除一切干扰因素,在对照两种种子的产量是否有差异时,统计学家往往会种植36块或者更多的土地,进行两组种子的随机对照试验,以足够的样本来验证两组种子的产量是否有显著差异。

---------+---------

听说喝啤酒和包尿布更配哦!


  毕业后,我进入海曙区统计局工作,日常工作中最大的难点,是统计报表很难按时收齐,在催报报表的时候,经常会遇到很多奇葩的理由。

  有一次,负责规模以上服务业统计的小吴在担心,总是有几家单位的统计员,经常在外地出差,报表的报送不规律,担忧这个月数据上会“开天窗”。


  旁边负责规模以下服务业报表的小葛安慰小吴说:你不错了,规模以上单位总体还是靠谱的,规模以下单位更加不忍直视,不是会计怀孕,就是老板跑路,总之,没有哪一个月可以顺顺利利收集齐的。


  坐在对面的负责综合分析的小郭一本正经的说:如果从数据挖掘的角度来看,‘会计怀孕’和‘老板跑路’是否存在什么因果关系呢?


  O__O "…这脑路,大家都笑到喷饭了。

科普:数据挖掘

  数据挖掘(英语:Data mining),又译为资料探勘、数据采矿。它是数据库知识发现(英语:Knowledge-Discovery in Databases,简称:KDD)中的一个步骤。


  数据挖掘一般是指从大量的数据中通过算法搜索隐藏于其中信息的过程。数据挖掘通常与计算机科学有关,并通过统计、在线分析处理、情报检索、机器学习、专家系统(依靠过去的经验法则)和模式识别等诸多方法来实现上述目标。

  但是在现实生活中,这样的数据挖掘可是给商家帮了大忙哦!


  比如,最为著名的“尿布和啤酒”的例子。据数据挖掘人们发现:尿布与啤酒更相配。这可不是一个笑话,这是发生在美国沃尔玛连锁店超市的真实案例。

小故事:尿布和啤酒更相配

  在沃尔玛超市里,有一个有趣的现象:尿布和啤酒赫然摆在一起出售。但是这个奇怪的举措却使尿布和啤酒的销量双双增加了。


  原来,沃尔玛拥有世界上最大的数据仓库系统,为了能够准确了解顾客在其门店的购买习惯,沃尔玛对其顾客的购物行为进行购物篮分析,想知道顾客经常一起购买的商品有哪些。沃尔玛数据仓库里集中了其各门店的详细原始交易数据。在这些原始交易数据的基础上,沃尔玛利用数据挖掘方法对这些数据进行分析和挖掘。一个意外的发现是:"跟尿布一起购买最多的商品竟是啤酒!


  经过大量实际调查和分析,揭示了一个隐藏在"尿布与啤酒"背后的美国人的一种行为模式:在美国,一些年轻的父亲下班后经常要到超市去买婴儿尿布,而他们中有30%~40%的人同时也为自己买一些啤酒。产生这一现象的原因是:美国的太太们常叮嘱她们的丈夫下班后为小孩买尿布,而丈夫们在买尿布后又随手带回了他们喜欢的啤酒。

  按常规思维,尿布与啤酒风马牛不相及,若不是借助数据挖掘技术对大量交易数据进行挖掘分析,沃尔玛是不可能发现数据内在这一有价值的规律的。而擅长于统计分析、数据挖掘的统计人,往往能摒弃固有观念,关注到这些脑路清奇的数据关联。


---------+---------


如何找到Mr.Right?


  海曙统计的同事心态都很好,好到什么程度?

比如,他们认为有“回归定律”,所以每个人遗传给下一代的优秀基因,都是趋于平均数的。通俗的来说,就是“龙生龙、凤生凤,但是老鼠的孩子不一定只能打洞”。他们相信,是金子总是会发光,如果没有发光,最显著的原因是还不够优秀。


  他们还说,生活是有风险的,即使我们使用最优的方法,也不可能每次都获得最完美的结果。为此,他们给我讲了一个“波斯公主选驸马”的故事。


寻找最优解:波斯公主选驸马

  波斯公主到了适婚年龄,要选驸马。候选男子100名,都是公主没有见过的。

  候选驸马按随机顺序,从公主面前逐一经过。每当一位男子在公主面前经过时,公主要么选他为驸马,要么不选。


  如果选他,其余那些还没有登场的男子就都遣散回家,选驸马的活动也就结束了。

  如果不选,当下这名男子就离开,也就是直接淘汰此人,下一人登场。被淘汰的,公主不可以反悔重选。


  规则是,公主必须在这百人中选出一人做驸马,也就是说,如果前99人公主都看不中的话,她必须选择第100名男子为驸马,不管他有多么丑陋。


  任务是,给公主设计选择方法,让她有最高概率选到百人中最英俊的男子为驸马。

  统计人给出的答案是:首先淘汰掉最开始的 100/e 名男子(e =2.718… 是自然对数,即100/e 约等于 37)。但是记录下这 37 名男子中最英俊者。之后鱼贯而来的男子中,出现的第一位英俊程度超越所有前 37人者,即为驸马。如果人都走光了,也没出现这么一位 Mr. Right,那么就只好选择第100位男子。


  这个答案还告诉我们一个可广泛运用的思维方式。公主选择的难处在于她不知道这百人的英俊程度是怎样分布的,是在怎样一个范围内。所以她最佳的策略是,淘汰掉最初 37 位男子,但是把他们看成一个有代表性的“样本”,从而了解这百人相貌的大致分布。然后在这个认知的基础上进行选择,就有最大的概率能获得最佳答案。


  所以,当遇到挫折时,我们大可不必因此就轻言放弃,甚至深受打击、一蹶不振。而是要告诉自己,“这只是测试样本而已,现在,我要打起精神来面对后面更多的选择哦!”


  当获得一些成绩和荣誉时,我们要学会告诫自己:成功是有偶然性的,并不是每次足够努力就一定能成功,并不是按照经验去做就一定能成功,必须认真对待每一项任务!


  优秀的人不一定有机会,但机会来了,你必须是优秀的!


往期精彩回顾:

海统心声丨“诗”意统计

海统心声丨奏青春之歌 筑统计之梦

数说 | 节后上班第一天,你该……

海统心声 | 你要多努力才能毫不费力?

数说 I 给孩子的压岁钱多少最好?



如果觉得不错就随手分享出去,并给小编点个赞哦!

文章已于修改

    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存